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摘 要 
本 文 是 应 用 群 分 析 研 究 奖 蕊 局 根 状 荆 组 中 国 分 类 群 分 类 的 一 次 尝试 。 分 类 特征 取 用 了 形态 学 ,细胞 学 、 
花粉 形态 和 生物 化 学 等 多 方面 的 性 状 进行 综合 分 析 ; 方 法 和 手段 上 使 用 了 距离 系数 、 相 关系 数 等 各 种 群 分 析 
运算 方法 , 状 且 以 综合 系数 进行 评价 。 不 仅 取得 了 与 传统 分 类 基本 一 致 的 分 类 结 加 ,为 该 组 植物 的 系统 分 类 
提供 窜 有 启发 性 的 参 沽 ， 同 时 也 为 宫 等 植物 数量 分 类 研究 找到 一 种 最 优 分 类 方法 一 相关 系数 UPGMA 法 ， 
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20 多 年 来 特别 是 近 十 几 年 来 ， 由 于 统计 数学 和 电 算 技术 的 发 展 和 应 用 ， 植 物 数量 分 
类 学 (Numericai taxonomy) 的 研究 发 展 很 快 (23、4、53 。 许 多 传统 分 类 学 的 研究 者 都 
应 用 数量 方法 检验 他 们 原来 的 分 类 结果 。 每 年 都 有 大 量 的 文献 发 表 。 但 是 在 国内 ， 对 于 
高 等 植 获 数量 分 类 研究 至 今 报 道 仍然 较 少 。 本 文 应 用 群 分 析 对 暮 绅 属 根 状 茎 组 中 国 分 类 
群 进行 一 次 数 反 分 类 的 党 试 。 

薯 绪 属 根 状 蕉 组 秆 狗 是 一 个 以 我 国 为 分 布 中 心 的 自然 类 群 。 由 于 其 根 鞋 内 含 暮 费 扎 
起 元 可 供 合成 口服 避孕 药 和 其 它 激素 药物 ， 故 对 于 本 组 社 物 系统 学 的 研究 ， 一 直 受 到 国 
内 外 学 着 的 重视 。 很 据 该 组 植物 表 型 特征 发 育 的 不 平衡 性 ， 实 际 存 在 的 禧 物 中 往往 出 现 
各 种 不 同 特 征 的 组 合 ， 因 此 这 些 分 类 群 的 表 型 特征 就 具有 统计 学 的 特点 ， 应 用 群 分 析 有 
可 能 获得 一 个 比较 自然 的 分 类 ， 对 传统 分 类 的 类 群 划分 和 亲缘 关系 也 可 得 出 一 个 比较 正 
确 的 评价 。 





二 、 材 料 与 方法 


我 们 取 薯 蔬 属 根 状 荃 组 原 16 种 ， LI 亚 种 和 1 变种 组 成 18 个 分 类 运算 单位 Operati- 
onal taxonomic unit， 即 “OTU”， 以 下 简称 为 “分 类 单位 ”) 。 分 类 单位 按 种 名 字母 
音 序 给 予 编号 AMRI) o RRE (Characters) 取 36 个 ， 其 中 属 外 部 形 态 学 特征 


本 文 于 1982 年 8 月 10 日 收 到 。 
* 本 文 承蒙 单 人 骅 教授 审阅 ， 谨 此 致谢 ， 
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23 个 、 细 胞 学 2 个 、 花 粉 形态 3 个 、 植 物化 学 5 个 、 地 理 分 布 3 个。 特征 状态 (Char- 
acter states) 原始 记录 主要 根据 裴 鉴 、 丁 志 遵 等 (1979) O 对 该 组 中 国 分 类 群 的 分 类 
资料 ， 同 时 作 了 有 关 花 和 果实 细节 构造 的 一 些 补充 观测 ， 作 者 等 的 观测 记录 取 自 90 份 标 
本 * (每 个 分 类 单位 5 份 )。 

全 部 特征 形态 记录 分 三 种 情况 进行 数据 编码 ， 即 二 元 特征 (有 13 个 ) ， 有 序 多 态 特 
征 ( 有 11 个 ) 和 连续 数值 特征 (有 12 个 )。 为 了 编码 方便 少数 无 序 多 态 特征 作 适 当 的 考虑 也 
都 纳入 有 序 多 态 特 征 。 个 别 缺 失 的 数据 按 数 量 分 类 运算 中 不 可 比较 (NO comparison, 
简写 作 "NC'" ) 处理。 编码 以 后 获得 的 数据 ， 将 分 类 单位 编号 按 行 的 次 序 ， 特 征 编号 按 
列 的 次 序 进 行 排列 ， 得 到 t+ 行 ( 共 t =18 个 分 类 单位 ) ，1n 列 ( 共 n 二 36 个 特征 ) 原始 
KEE, BURA ENS is HE ee ETT. 

群 分 析 运 算 方 法 和 步骤 如 下 ， 

首先 对 编码 所 获得 的 原始 数据 按 特 征 方向 进行 标准 化 (Standardization)， 标 准 化 变 
HMF: = 

Yu-Y; ; 
Kya Gen Boy ty Fly Be my 9), 


在 此 Yes 表示 原始 数值 矩阵 第 i 个 分 类 单位 ， 第 i 个 特征 的 数值 ;经 标准 化 变换 得 到 相 
应 的 值 记 作 X8 了 和 SS 分 别 表 示 第 7 个 特征 的 平均 值 和 标准 差 。 
再 计算 距离 系数 (Distance coefficients) 和 相关 系数 (Correlation coefficients) ， 





计算 公式 分 别 如 下 : 
距离 系数 
lin 4 
Du= (p È (raw 50)? ] Fe Ci, fl, 2, s t) 
相关 系数 


,之 ， (xin — Xi) (Xip Xi) 


Ri;= Ci, Jul, 2, *, t )。 





n n 1 
| = (xip Xi) È (x sn-%3)?| = 
kai k=1 


* 藏 江苏 省 植 牺 研究 所 标本 室 

附录 :TIT 、 分 类 特征 一 1。 根 状 划 形状，2.。 根 状 蕉 表皮 质地 ， 3.。 根 状 蕉 栓 皮 层 剥 落 状 况 ， 4. 根 状 蕉 表皮 颜色 ，5. 根 状 
尘 内 部 质地 ，6, 叶 形 ，7. 叶 型 ，8, 叶 背 被 覆 物 ，9. 叶 枉 基 部 具 刺 与 否 ， 10, 叶 片 质地 ， 11。 叶 片 压 干 后 颜色 ， 
12.。 花 被 压 于 后 颜色 ，13. 雄 花 柄 最 大 长 度 ，14.。 雄 花序 分 枝 回 数 ， 15, 雄 花 被 管 最 大 长 度 ，16, 雄 划 数 ， 17, 花 
AMIE A, 18 MEME ME, 19. EGA, 20. CRE, 21 ATERRAR ERLE, 220 RR 


HK, BATERE, MARRE ERREKI, 25. IA, 26.7 EH, 27 


ER, 2. REAM A, 29.8KR RIA, 30. SABRE, 31. BWR, 32 WP ERR 
RREH, 3.MHBRERNAM, KEM, 35. EAM DTM, 36H I WER. 

I. 4X1. 922 "| WB Dioscorea althaeoides, 2.47 D. banzhuana, 3. 3u MB D. biformifolia, 
4al D. chingii, 5. MRD. collettii, 6.= fr $D. deltoidea, 7.0 MAHD. futchauensis, 
8.224 D. gracillima, 9.428 D. collettii var. hypoglauca, 10.2 Æi D. nipponica, 11.3% 
黄姜 D. nipponica subsp. rosthornii, 12. 黄 山药 D. panthaica, 13.298 D. poilanei, 14.43 RM D. 
septemloba, 15.5% ##i D. simulans, 16.414 #i D. tenuipes, 17-1 Æ D. tokoro, 18.a et D. 


zingiberensjs。 
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RTS xu。 其它 已 经 引用 过 的 符号 意义 相同 。 

将 每 一 对 分 类 单位 的 系数 都 计算 出 来 ， 得 到 距离 矩阵 和 相关 和 矩阵。 这 两 个 矩阵 定量 
地 表示 被 分 类 类 群 中 分 类 单位 之 间 的 亲缘 关系 ， 复 杂 的 系统 关系 根据 该 矩阵 进行 聚 类 运 
算 而 产生 。 

群 分 入 的 聚 类 运算 采用 聚合 的 逐 类 〈 聚 类 前 每 -- 次 循环 运算 只 形成 一 个 结合 的 新 类 
TO 配对 法 〈 每 次 结合 的 类 群 仅 由 两 个 类 群 合并 而 成 ) 。 这 个 方法 由 多 次 循环 步骤 来 完 
成 , 每 循环 一 次 对 于 新 结合 的 类 群 , 它 的 相似 性 系数 需要 重新 计算 ， 不 同 的 计算 方法 又 引 
出 不 回 的 聚 类 方法 。 我 们 的 运算 对 距离 系数 取 用 了 单 联 法 (Single linkage method), 4 
联 法 (Complete iinkage method) , WPGMA ( Weighted pair-group using arithmetic 
averages methods) , UPGMA (Unweighted pair-group method using arithmetic aver- 
ages) OPARI IE, BAP WANK, Bobi, BARR AAA, MCR OAT 
音 联 法 、 企 联 法 、WPGQaMA 法 、UPGMA 法 和 Spearman 法 等 。 所 谓 Spcarman 法 是 指 类 
群 合并 时 ， 系 数 的 计算 采用 Spearman 公 式 。 

和 于 崇 类 运算 采用 了 多 种 方法 ， 需 要 从 多 种 方法 中 选择 最 好 的 方法 ， 这 就 是 所 谓 最 
优 分 类 问题 。 最 优 分 类 是 数量 分 类 学 中 尚 待 衔 底 解决 的 理论 问题 。 为 了 解决 最 优 分 类 问 
题 ， 关 键 是 要 确定 判别 最 优 的 标准 ， 通 常 都 以 协 表 和 矩阵 (Cophenctic matrix) 与 最 初 的 
相似 性 矩阵 进行 比较 而 得 到 。 在 这 个 基础 上 有 三 个 比较 系数 常常 被 采用 ， 

M =max{|Dyj- Diil}, 


ee S(D D*,)2 十 


> = (Dy; - D) (D#; - D*) 
“US (Du - D)? S S(t ADIs 





和 R 


其 中 求 和 号 与 求 最 大 值 都 是 对 标号 ?=2，3，…， EMG =1, 2, ee, i- LH 
行 ; DF Dag 分 别 表示 协 表 矩阵 和 原 相似 性 矩阵 的 第 i 行 ,第 7 列 元 素 ，D* 和 表示 其 相 
应 的 平均 值 ; t 表示 矩阵 的 阶 数 ， 也 即 分 类 单位 个 数 。 

从 这 三 个 比较 系数 的 表达 式 可 以 看 出 ， 系 数 M 和 -4 值 愈 小 ， 尺 值 愈 大 显示 协 表 和 矩阵 
与 原 相似 性 矩阵 有 较 大 的 拟 合 度 ,分 类 结果 较 优 。 从 表达 式 又 可 以 看 出 , 以 它们 来 衡量 分 
RAEN, FRENTE BN, BML, RUE RBA PURER DE BB 
数 的 最 优 。 本 文 的 计算 结果 也 出 现 了 这 种 不 一 致 性 ( 见 表 1) 。 

为 了 殉 服 不 一 至 性 的 缺点 ， 我 们 建立 综合 比较 系数 ， 以 下 简称 综合 系数 。 在 给 出 这 
个 系数 的 表达 式 之 前 先 定义 系数 

M’ =M |Cmax{D?;} - min{D* ;}) 
在 此 求 最 大 值 和 最 小 值 仍然 是 对 标号 ?1 = 2, 3, e, FAIS =1, 2, =, i- 13% 
行 。 综 合 比较 系数 表示 如 下 : 

S=am+BA+v(1-R), 
Hpo, BA v 是 事先 选 定 的 常数 。 
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表 1 群 分 析 运 算 方 法 的 比较 
各 种 不 N 的 k 8 系 数 
方 法 TED a 
M M’ A R S 

( # 联 法 0.577 0.608 0.252 0.835 0.240 
距 | 全 KR 法 0.732 0.557 0.253 , | 0.813 0.240 
| WPGMA 法 0.495 ` 0.416 0.147 0.835 0.173 
| 中 间距 离 法 (B=0.1) 0.767 0.538 ” 0.334 0.781 0.274 
离 差 平方 和 法 0.863 0.588 0.410 .0.742 0.321 
a| E ò 法 0.523 + 0.584 0.292 > 0.850 0.245 
UPGMA 法 ; 0.401 > 0.374 0.128 0.849 0.151 
* 可 变 类 平均 法 (B=0.1) 0.469 0.502 0.163 0.856 0.186 
ee 变 法 0.406 0.343 0.132 0.851 0.151 
(* 联 法 0.670 0.636 0.248 0.683 0.294 
| 全 KR 法 0.593 1.103 0.298 0.500 “ 0.450 
的 WPGMA 法 0.381 0.483 0.127 0.701 06228 
a | UPGMA 法 ©. XN 0.874" 0.473 0.126 0.709 0.218 
| SPEARMAN 法 ‘1.190 0.745 0.602 0.508 0.489 


实际 上 ， 综 合 系数 9 是 三 个 系数 MK、 AM- 及 的 线性 组 合 。 这 三 个 系数 单独 使 用 ， 
什 仿 小 表示 分 类 结果 愈 好 。 由 于 它们 仅仅 从 数量 关系 的 菜 一 个 方面 衡量 分 类 结果 的 好 与 
坏 ， 因 此 都 带 有 一 定 的 片面 性 。 新 的 系数 5 综合 了 这 三 方面 的 结果 ， 在 具体 运算 中 还 可 
以 根据 要 求 不 同 选 适当 的 一 组 常数 c、B 和 v ， 得 到 一 个 比较 全 面 的 最 优 判别 标准 。 

采用 综合 系数 后 ， 数 值 计算 并 未 增加 更 多 的 运算 量 。 因 为 在 编写 电子 计算 机 程序 
时 ， 有 许多 运算 上 的 共同 之 处 。 实 际 上 ， 将 4 或 尽 其 中 一 个 系数 计算 出 来 ， 综 合 系数 也 
就 唾 手 可 得 。 | 

ERIK RIN, AAs, B= LAY = LRU A REL, HIA 
果 列 在 表 2 的 最 后 一 列 。 对 各 种 运算 方法 优 劣 的 评价 通过 综合 系数 的 数值 大 小 一 目 了 
然 ， 距 离 系数 以 UPGMA 法 和 可 变法 最 好 ， 相 关系 数 以 UPGMA 法 最 好 。 

最 后 将 三 个 分 类 结果 作出 树 系 图 ， 见 图 1、2 、3。 

全 部 数值 运算 以 ALGOL 语言 编写 程序 。 在 中 国 科 学 院 计算 中 心 TQ-16 型 机 上 和 进 
行 计算 。 | 
三 、 分 析 与 讨论 

通过 分 类 运算 我 们 获得 了 著 闭 属 根 状 从 组 18 个 种 的 表 型 分 类 结果 。 在 运算 中 第 一 次 
使 用 综合 比较 系数 来 选择 最 优 分 类 ， 运 算 结 果 表 明 综合 系数 的 判别 与 生物 分 类 实际 经 验 
的 检验 十 分 易 合 ， 较 小 的 系数 全 分 类 结果 好 ， 反 之 分 类 结果 较 差 。 根 据 我 们 的 初步 经 
验 ， 如 此 确立 的 综合 系数 值 ， 当 小 于 0.30 时 ， 分 类 结果 已 能 够 反映 原 相似 矩阵 所 包含 的 
基本 的 相似 性 关系 。 运 算 最 后 选取 的 三 种 方法 综合 系数 都 显著 低 于 0.30 〈 兄 表 1) ， 所 
以 分 类 结果 较 好 。 
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但 是 数学 意义 上 的 选择 有 时 不 一 定 与 实际 情形 相符 合 ， 数 学 上 的 最 优 并 不 完全 等 于 
生物 学 意义 上 的 最 优 。 这 是 因为 整个 数量 分 类 工作 经 过 了 许多 步骤 ， 如 特征 的 确定 ， 数 
据 的 编码 和 系数 的 选择 等 ， 如 果 这 些 步骤 有 所 失误 ， 尽 管 在 群 分 析 的 聚 类 运算 时 选取 了 
最 优 方 法 ， 也 会 造成 不 能 令 人 满意 的 分 类 结果 。 所 以 在 取 用 综合 系数 的 同时 ， 还 需要 我 
们 从 生物 学 的 实际 经 验 对 分 类 结果 做 进一步 的 评价 和 筛选 。 本 文选 取 的 三 种 分 类 方法 ， 
以 相关 系数 UPGMA 法 与 传统 的 分 类 经 验 比 较 一 致 。 决 定 以 这 个 方法 的 树 系 图 作为 分 类 
的 最 后 结果 。 并 在 此 基础 之 上 作 进 一 步 的 分 析 与 讨论 。 

Eades (1965) , Fisher Rohlf (1969〉 曾 报道 距离 系数 受 随机 性 干扰 的 影响 较 小 ， 
优 于 相关 系数 63。 但 是 本 文 的 结果 说 明 相关 系数 比 距 离 系数 好 。 由 图 2, EBA 1 一 
相关 系数 - 0.056 的 水 平 上 , 根 状 荃 组 中 国 分 类 群 18 种 能 很 好 地 显示 出 4 个 组 合 , 即 第 一 
组 合 包含 种 10、11、1 、 和 种 6 等 4 种 ; 第 二 组 合 包含 种 18、3 、2 、 和 种 15 等 4 种 ; 
第 三 组 合 包 含 种 7 、14、17、13、4 、16、 和 种 12 等 7 种 以 及 第 四 组 合 包含 种 5 、 9 、 
和 种 8 等 3 种 。 由 图 2 还 可 看 到 ， 在 阐 值 一 相关 系数 0.17 的 水 平 上 ， 仍 能 分 辨 包含 种 
10、11、1 、 和 包含 种 5、9 、8 、 的 两 个 组 合 而 其 余 12 种 就 较 分 散 。 当 我 们 把 阔 值 I 
MAE I 两 个 不 同 水 平 上 所 办 识 的 类 群 综合 起 来 作 进一步 分 析 时 ， 就 显而易见 这 两 个 组 
合 乃 是 两 个 稳定 的 类 群 ， 根 据 分 类 学 经 验 可 据 种 翅 项 生 和 种 翅 周 生 明 显 区 别 开 来 。 因 此 
这 一 结果 可 作为 根 状 荃 组 中 国 分 类 群 划分 系列 时 参考 。 

再 则 由 图 2 清晰 地 表明 近 缘 种 对 和 较 远 缘 种 或 孤立 种 。 如 ， 穿 龙 暮 蔬 与 山 黄姜 ， 又 
蕊 薯 贰 与 粉 背 薯 贰 以 及 福州 昔 贰 与 绵 昔 花 均 为 近 缘 种 对 而 盾 叶 昔 贰 为 较 远 缘 种 或 弧 立 
种 。 上 述 两 方面 的 结果 都 与 传统 分 类 基本 一 致 而 距离 系数 对 前 述 的 根 状 茎 组 中 国 分 类 
群 的 分 类 组 合 就 不 能 辨识 〈 见 图 2、3) 而 且 种 类 之 间 亲 缘 也 较 混 乱 。 因 此 实际 上 相关 
系数 更 适合 于 对 生物 类 群 特别 是 植物 类 群 的 分 类 和 亲缘 关系 的 描述 与 表达 。 这 一 点 不 难 
”理解 ， 例 如 对 形态 极为 相似 而 个 体 或 器 官 大 小 相差 十 分 悬殊 的 两 个 同 种 植株 ， 如 以 相似 
性 数量 值 描述 它们 之 间 的 表 型 亲缘 ， 距 离 系数 则 不 正常 地 偏 大 ， 而 相关 系数 却 能 够 十 分 
令 人 满意 地 体现 两 者 之 间 的 亲缘 。 所 以 相关 系数 适合 植物 分 类 学 的 研究 :距离 系数 可 能 
适合 于 生态 学 中 某 些 生态 因子 的 定量 研究 [57。 

最 后 ， 必 须 指 出 的 是 ， 这 次 数量 分 类 研究 虽然 基本 上 与 传统 分 类 取得 了 相 一 致 的 结 
果 ， 但 是 仍 存在 某 些 差异 特别 是 个 别 种 和 亚 种 的 关系 (如 ，D。nipponica 与 D。 nipponica 
Subsp. rosthornii) 不 很 一 致 。 我 们 通过 这 次 尝试 体会 到 ， 对 数量 分 类 来 说 ， 分 类 特征 
挑选 工作 犹如 传统 分 类 一 样 是 最 重要 的 环节 。 我 们 在 这 次 研究 中 ， 由 于 分 类 特征 取得 尚 
不 多 〈36 个 ) ， 其 中 定性 的 又 占 213 ， 此 外 可 能 在 编码 上 也 有 饼 陷 (如 ，N C 的 数目 较 
多 ) ， 因 此 还 不 能 根据 这 次 研究 进行 分 类 学 的 修订 ， 但 是 这 些 差异 至 少 为 根 状 荃 组 系统 
分 类 提供 了 富有 启发 性 的 参考 。 存 在 的 问题 有 待 今后 作 进一步 的 研究 。 
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Abstract 


This paper deals with the application of the numerical method in plant 
taxonomical research, 

Using Sect, Stenophora Uline as an example, interspecific variability was 
measured by using methods of cluster analysis. Analysis with 36 phenetic char- 
acters (23 external morphological, 2 cytological, 3 palynological, 5 phytoche- 
mistrical, 3 geographical and distributional) supports the delimitation of the 18 
species as distinct taxa on the basis of correlation coefficient and distance coeff- 
iciont, Comparing with Pci et Tings (1979) systematic studies, similar results 
were found with correlation UPGMA method for cluster analysis. 

On the basis of the measure of the agreement between the original similarity 
matrix and the cophenctic matrix, we define the synthetical coefficient as a cr- 
iterion of optimality for a classification, and make use of it to find out the op- 
timal classification, 

In this particular study, it leads us to realize that numerical analysis prov- 


ides a graphic quantified means for comparison of a group of taxa, 


